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Abstract 


Cet article montre à quel point l’algèbre linéaire, les polynômes et les corps finis 
sont présents dans de nombreuses applications concrètes touchant aux domaines de 
l'information et de la communication. Il informe sur l’enjeu actuel du transfert des 
informations et sur les moyens algébriques mis en oeuvre pour réaliser une ”commu- 
nication parfaite”. 


1 Introduction 


Si la première moitié du vingtième siècle à été celle de la révolution analogique par la radio 
et la télévision, la seconde moitié de ce siècle est celle de la révolution numérique et de 
l’utilisation systématique de l’algèbre dans la transmission de données. 


Ainsi, après l'apparition des CD Audio dans les années 1980, il faut compter sur le 
développement de la diffusion par satellite et l’utilisation de nouveaux moyens de com- 
munication tels la télécopie, le réseau internet ou le téléphone numérique. Les données 
(textes, images et sons) sont maintenant engrangées sur des CD-ROM dont les lecteurs sont 
munis de systèmes de correction d’erreurs. Même la photographie et la radio deviennent 
numériques. 


Les techniques de restitution d’images ou de sons sont liées à la transmission et à la lecture 
correcte de nombreux messages numériques, encore appelés mots”. Un message est formé 
de mots eux mêmes constitués de symboles (ou bits) pris dans un alphabet. Prenons le 
message 00101 formé de 5 bits valant chacun 0 ou 1. Si nous transmettons le message 
tel quel, une erreur de transmission ou de lecture peut avoir lieu et rendre le message 
inintelligible. Décidons de répéter ce message trois fois, et d’envoyer : 


001010010100101. 


Si le message reçu comporte moins d’une erreur, cette erreur peut être corrigée. S'il 
comporte moins de deux erreurs, le récepteur est capable de détecter qu’il y a eu erreur 
mais ne peut pas toujours récupérer le message originel. Enfin, s’il se produit plus de deux 
erreurs pendant la transmission, le récepteur peut ne pas les détecter. 


[ecod0002] v1.10 APMEP 415, 1998, pp.173-191. (dernière révision : 1 juin 2001) 


Nous venons de voir un premier exemple de code correcteur d’erreur, appelé code à 
répétition. Ce code, qui corrige une erreur et en détecte deux, est utilisé dans certains 
lecteurs de CD Audio possédant trois têtes de lecture. Le signal 0 ou 1 est lu indépendam- 
ment par chacune de ces trois têtes pour donner un mot de trois chiffres, et une erreur de 
lecture peut être corrigée. 


Remarquons bien qu’il est naturel d’allonger un message pour le protéger. Prenons les 
mots d’un language. Ils sont en général très éloignés” les uns des autres, deux mots 
différant selon leurs longueurs et selon les lettres et les syllabes utilisées. Ainsi on confondra 
difficilement les mots ” bibliothèque” et armoire” même si ces mots sont mal prononcés ou 
entendus, et l’on reconstituera naturellement le message dans une conversation quand bien 
même certains sons seraient supprimés ou déformés. Les aviateurs quant à eux épèlent 
leurs numéros d’immatriculation en disant ” alpha zoulou” pour ? AZ”... 


Un deuxième exemple de détection d’erreurs largement utilisé en informatique est 

l’adjonction d’un bit de parité. Reprenons le message 00101 et ajoutons lui un dernier 
bit obtenu en additionnant les cinq bits du départ modulo 2. Le message devient 001010 
et permet de détecter une erreur sans toutefois pouvoir la corriger. Pour cela, on fait la 
somme de tous les bits pour obtenir 0 s’il n’y a pas eu d'erreur, et 1 dans le cas contraire. 
Ce code, appelé code de parité, est utilisé un peu partout : dans les numéros de sécurité 
sociale où l’on rajoute la ” clé”, dans ceux des comptes bancaires ou encore dans les code- 
barres des supermarchés où c’est le 13-ième chiffre qui constitue la clé de contrôle. 


Ces deux exemples fondamentaux sont à la base de la théorie du codage et montrent que 
l’on peut maîtriser l’apparition d’erreurs en allongeant volontairement le message avant 
sa transmission ou sa lecture. Des techniques algébriques plus sophistiquées sont ensuite 
utilisées pour améliorer les performances du codage, le but étant : 


- de savoir si des erreurs se sont produites (problème de la détection), 

- de retrouver le message correct à partir du message reçu (problème de la correction), 

- de corriger le plus d’erreurs possibles tout en utilisant le moins de bits supplémentaires 
possibles (problème de la performance du codage). 


Du point de vue mathématique, l’un des intérêts de la théorie des codes est de montrer que 
l’algèbre s'applique fondamentalement dans notre vie de tous les jours dès que l’on écoute 
de la musique ou que l’on s’installe devant son téléviseur, et que des notions aussi abstraites 
que celles d'espaces vectoriels ou de polynômes sur des corps finis nous permettent de 
lire des messages, d'écouter de la musique ou de regarder des films dans des conditions 
optimum. Ces applications pratiques me servent parfois à justifier aux yeux des étudiants 
de DEUG l’apprentissage des techniques d’algèbre linéaire. Elles donnent aussi une réponse 
aux lycéens qui se demandent à quoi peuvent bien servir les polynômes. 


2 Code correcteur d’erreurs 


Soit Q un ensemble fini à g éléments. Soient k£ et n deux entiers naturels non nuls avec 
k < n. L'ensemble des messages sera une partie Æ de Qf, et l’on introduit une application 
injective 


appelée application de codage ou encodeur. Le message ou mot a est un élément de 
E. Il est modifié pour fournir le mot f (a) = c € Q". C’est le mot c qui sera transmis et 
lu par un sytème quelconque pour donner un message reçu æ = (41,..….,%n) éventuellement 
entaché d'erreurs. 

Notons C = f(E) l’image de f. Comme f est injective, f réalise une bijection de Æ sur 
C'et C' peut être considéré comme l’ensemble de tous les messages possibles. Cest appelé 
code de longueur n, et les éléments de C s'appellent les mots du code. Le cardinal 
du code est par définition celui de C. On le notera #C' ou M. Pour mesurer le degré de 
différence entre deux mots x et y de Q", on utilise la distance de Hamming d définie 
par 


Van QT. AE UEN, Tele 


On vérifie facilement que d est bien une distance sur Q”. La distance minimale du code 
C'est la distance minimum entre deux mots distincts de ce code. On la note d(C') ou d, 
et 


d=Min{d(x,y) /x,ye C avec x £ y}. 


Un code C de longueur n, de cardinal M et de distance minimale d est appelé code 
(n, M, d). Les nombres n, M, d sont les paramètres du code. 


d joue un rôle important car se trouve en relation étroite avec le nombre d’erreurs sus- 
ceptibles d’être corrigées. Supposons que le message soit € = (c1,...,@) et qu'il y ait eu 
moins de t erreurs de transmission ou de lecture. Le message obtenu x = (x1,...,2,) vérifie 
d(x,c) <t. On peut retrouver c à partir de x si, et seulement si, il existe un seul mot de 
code situé à une distance de x inférieure ou égale à t. Autrement dit, il faut et il suffit 
que les boules fermées de rayon t centrées sur les éléments du code C soient disjointes. Un 
code corrigera t erreurs si cette condition est vérifiée. En notant [r] la partie entière 
d’un réel r : 


Théorème 1 Un code C de distance minimale d corrige au plus e = [ES] erreurs et en 
détecte d — 1. 


Preuve : Si x vérifie simultanément d(x,c) <e et d(x,c) < e où c,c’ sont des mots de 
C, alors 


d < d(c,c) < d(c,x)+d(x,c) < 2e 


ce qui est absurde puisque 2e < d — 1. Aïnsi C corrige e erreurs. Pour vérifier que © ne 
corrige pas plus de e + 1 erreurs, on envisage le cas le plus défavorable où les mots c et c 
de C' sont à distance minimum, i.e. où d(c,c') = d, et l’on choisit un mot + du segment 
[c, ] tel que d(c,x) = e+1. Dans ce cas d(c,x) +d(x,c) = d(c,c) = d. Supposons que 
c soit le message envoyé et x le message reçu dans lequel il y a e + 1 erreurs. 


d(x,“)=d-—(e+1)<d(c,x) 


montre que c’ est un mot de code plus rapproché de x que ne l’est c. Le décodage consistant 
à remplacer x par le mot de code le plus proche de x donnera € si l’inégalité précédente 
est stricte, ou bien hésitera entre c et d si l'inégalité est une égalité (voir figure ci-dessous). 
Dans les deux cas la correction de l’erreur est impossible. m 


C X c'! C X c'! 


O————@ ———à— 


> € > 
d=3 et e=1l d=H et e=l 


L’entier e = [£1] représente la capacité de correction du code C', et C est appelé 


code e-correcteur d’erreurs. 


3 Codes linéaires 


3.1 Définitions 


Rappelons que si q (distinct de 1) est une puissance d’un nombre premier, il existe un 
et un seul corps fini de cardinal q à isomorphisme près (cf. [3], [6]) Ce corps est noté F,. 
L'ensemble des messages E — F* est maintenant structuré en espace vectoriel de dimension 
k sur F,. Si l’on décide de n’utiliser que des encodeurs linéaires f, le code C = f (F$) 
devient un sous-espace vectoriel de F7. 


Définition 1 Un code linéaire de dimension k et de longueur n est un sous-espace 
vectoriel de dimension k de F9. Si la distance minimal de C est d, on dit que C'est un 
code [n, k, d] (ou simplement [n, k]). Si q = 2, on dit que C est un code binaire. 


Définition 2 Le nombre de coordonnées non nulles de x € F, est appelé poids de Ham- 
ming de x, et noté 


w (x) = {ie Nh/xi 0}. 


Comme d(x,y) = w(x — y), la distance minimale de C' s'écrit d = min {w (x) /x € C*}. 
Notons {G la matrice de l’application linéaire f : F* — F} dans les bases canoniques. (tG 
désigne la transposée de la matrice G). G est du type k x n (ï.e. à k lignes et n colonnes) 
et tout mot de C s'écrit c = f (x) = zG où c = (c1,.….,e,) € F9 et x = (21,…,2x) € FÀ 
sont des vecteur-lignes. 


Définition 3 La matrice G est une matrice génératrice du code C. Toute matrice H 
de type (n — k) x n vérifiant 


ECS He 
est appelée matrice de contrôle de C. On a C’=Ker H etrgH=n—k. 


3.2 Codes systématiques 


À chaque mot x = (x1,...,xx) du message on adjoint n — k symboles cx11,..., € dépendant 
linéairement des x; pour obtenir le mot de code c = f(x). Les symboles c; sont appelés 
bits de contrôle, et 


C — (x1, …., Tk; Ch+1; sie) —= (ty; PE) (le | A) 


où (14| A) désigne la matrice k x n obtenue en écrivant côte à côte la matrice identité 
14, de taille k et une matrice quelconque À. On dira qu’un code C est systématique 
s’il possède une matrice génératrice de la forme G = (1,|A). Dans ce cas, c € C'si, et 
seulement si, c=xG=xt(lx|A), et 


Caesar ( . ) tr= A te + tA tx = 0. 


C'est inclus dans Ker H où H — (— tA| Ps): Comme H est de rang n—k, les sous-espaces 
C'et Ker H ont même dimension k et donc C = Ker H. La matrice H — (— tA| 1-ÿ) est 
par conséquent une matrice de contrôle de C. 


Exemples : L'application f (x41,%2,23) —(21, 2, %3, d1, do +%3, 1 +29 +x3, t3) définit 
un code systématique C de type [7,3] sur F2. L'écriture 


1 O0 O0 1 0 1 0 
lisse) = re, Sal OÙ T1 20 | 60" dE CE Ù 
0 O I 0 1 1 1 


met en évidence une matrice génératrice de C' d’où l’on peut déduire la matrice de contrôle 

1004110 

1 en 1 

e : d. | ; 0 

O0 |: 20 40 

Le code de parité binaire vu dans l’introduction consiste à ajouter le bit de parité 

Ci1 = De à (x1,...,xx). C’est un code systématique [k + 1,k]. Le code à répétition 
i= 


consistant à répéter n fois le symbole x1 sera un code systématique [n, 1]. 


3.3 Codes MDS 


Théorème 2 Si C' est un code linéaire [n, k, d] de matrice de contrôle H, alors 
d =Min{s € N*/ül existe s colonnes de H linéairement dépendantes} . 


Preuve : Il existe un mot de code x = (x1,..,%») de poids d. Notons H = [h1,.…., hn] 
k 

où h; représente la i-ième colonne de H. x € C' signifie que Htx — 0, soit Sh =Ù0 
i=1 

et constitue une relation de dépendance d’exactement d colonnes de H. Il existera donc 

d colonnes linéairement dépendantes. D'autre part, si les s colonnes h;,,...,h;, de H sont 
S 

linéairement dépendantes, il existe une s-liste (x;,,.…,x,) 7 (0,...,0) telle que ÿ° x;,h;, — 
j=1 

0. En posant x; = 0 sit & {i1,.….,1,} et x = (11,...,2), on constate que x € C\ {0} et 

w (x) < 8, donc d < s.1 


Corollaire 1 Pour tout code [n,k,s], on ak+d<n+1. 


Preuve : H est une matrice de rang n — k, donc n — k + 1 de ses colonnes sont toujours 
liées et le Théorème entraine d <n—k+1.m 

La majoration d < n —k+1 est appelée borne de Singleton et un code [n, k, d] vérifiant 
d=n—k+1 est appelé code MDS (Maximum Distance Separable). Il s’agit alors d’un 
bon code puisque pour n et k fixés, d est maximum et le nombre d’erreurs qu’il est possible 
de corriger aussi. On notera que C est un code MDS si, et seulement si, n — k colonnes 
quelconques de Æ sont toujours linéairement indépendantes. 


4 Codes cycliques 


Un code linéaire C est dit cyclique s’il est stable par permutation à droite de ses com- 
posantes, 1.e. 


(ons db ae CS (ore dor0625) EG. 


Notons F, [x] l'algèbre des polynômes à coefficients dans le corps de Galois F, et (4° — 1) 
l'idéal engendré par le polynôme x" — 1. L’algèbre quotient F, [x] / (x — 1) est un F4- 


-n—1 


espace vectoriel de dimension n», dont une base est (1,2, # . Cela permet d'identifier 


(vectoriellement) un élément a = (ao, …, an-1) de F? au polynôme a (x) = ao + aix +... + 


an_14"7| de F, [x] / (x° — 1). Pour simplifier les notations, on oubliera de mettre le point 
au dessus de la classe de x, de sorte que l’on écrira 


a(xz) = a0+uT +... +an 12 EF, [x] /(x* —-1) 


le polynôme associé au vecteur a = (ap,.…, @n-1) € F7. Avec cette identification, C 
apparaît comme un sous-espace vectoriel de F, [x] / (x° — 1). Si C'est un code cyclique, 


a(x) = a0+ar+….+an 1e" LeC = ra(xr) = an1 +apr +. +as 22" leC 


et de proche en proche, x*a (x) € C' pour tout entier à. Ainsi b(x) a (x) sera dans C pour 
tout polynôme b et C' sera un idéal de F,[x]/(x" —1). Réciproquement, tout idéal de 
F,{x]/(x"° — 1) est un sous-espace vectoriel stable par permutation à droite des coordon- 
nées dans la base (1,x,...,x" 1), et l’on peut énoncer : 


Théorème 3 Moyennant l'identification des F,-espaces vectoriels F7 et F, [x] / (x° — 1), 
un code cyclique est un idéal de F, [x] / (x° — 1). 


Il s’agit maintenant de préciser la nature des idéaux de F, [x] / (x° — 1). Dans le Théorème 
suivant, on distingue encore une dernière fois g et g pour plus de clarté. 


Théorème 4 Soit k un corps et f € k[x]. L'anneau À = k{x] /(f) est principal, et tout 
idéal de À est de la forme (9) où g est un polynôme unitaire de k[x] qui divise f. De plus 
un tel polynôme g est unique. 


Preuve : Soit x : k[x] — À la projection canonique. Si J est un idéal de À, J=7 (1) 
est un idéal de l’anneau principal k[x], et l’on sait que le polynôme g € k[x] unitaire de 
plus bas degré de J vérifie J = (g). Comme x est surjective, 


FU) =r tr U)=T 


d'où I = (g). De plus m1 (0) = (f) € J montre que g divise f. 
Montrons maintenant l’unicité de g. Si h € k[x] vérifie I — (9) = (n). h = gu pour un 
polynôme convenable w, donc il existe v € k[x] tel que À = gu + fu. Comme g divise f, 


g divisera h. En recommençant de la même façon, on montre que À divise g, de sorte que 
les polynômes g et h soient unitaires et associés, donc égaux. mn 


Définition 4 Soit C un code cyclique. L'unique polynôme unitaire g de F,[x] qui divise 
x" — 1 et tel que C = (g) s'appelle le polynôme générateur du code cyclique C. 


Si C'est le code cyclique de longueur n sur F, et de polynôme générateur g, posons 
k=n— degg. L'application 


: k 
Ai F, 


— 
a — (ao, .. Qk_1) R 


est injective et applique F* sur C, donc réalise un encodage simple de © et montre que C 
est de dimension k = n — deg g. 


5 Codes BCH (Bose-Chaudhuri-Hocquenghem) 


Soient n un entier premier avec q et à une racine primitive n-ième de l’unité dans une 
extension algébriquement close de F,. Le corps de décomposition de 2° — 1 est Fm où 
m représente l’ordre multiplicatif de g modulo n, de sorte que toutes les puissances de 
a appartiennent à Fm. Avec ces notations, on appelle code BCH de longueur n et 
de distance construite d sur F, tout code cyclique de longueur n et de polynôme 
générateur 


g (x) = ppem(p, (x) , pre (x), .…., Drsa_2 (x)) 


où r et d sont deux entiers naturels non nuls avec 2 < d < n et où p; (x) représente le 
polynôme minimal de a sur F,. 

On notera que g divise x° — 1 et que g est le polynôme de plus petit degré dans F, [x] 
admettant les éléments distincts a”, a"+1,.…., a+d-2 comme racines. 

Si r = 1, on dit que C est un code BCH au sens strict. Si n = qg” —1, C'est appelé 
code BCH primitif(i.e. a est un élément primitif de Fm). Enfin un code de Reed- 
Solomon de longueur q — 1 est un code BCH de longueur qg — 1 sur le corps F, (i.e. a est 
un élément primitif de F,). 


Théorème 5 La distance minimale d’un code BCH est supérieure à sa distance construite. 


Preuve : Un mot a = (ap, &@1,.…., 4än-1) appartient à C si, et seulement si, le polynôme as- 
socié a (x) = ag+a17+..+an 12"! est multiple de g (x). Cela revient à dire que a (x) est 
divisible par chacun des polynômes p; (x), ou encore que a (x) admet a”, a"+1,.…., a"+dr2 
comme racines. Cela s'écrit 


dde ste Cab = 0 


pour tout j, ou encore H ta = 0 avec 


1 a” a? am Dr 

1 al a2tr+1) ar (r+1) 
H — 

i a"+d-2 a2{r+d-2) atn-1)(r+d-2) 


H est une matrice de contrôle de C et d — 1 colonnes quelconques de cette matrice sont 
indépendantes (utiliser un déterminant de Vandermonde). On applique le Théorème 2. m 


Théorème 6 Un code de Reed-Solomon de longueur q — 1 et de distance construite d 
(2 <d<q—1) est un code cyclique dont le polynôme générateur s'écrit 


g(x)=(æ-a")(x- at). (x L dite?) 


où a est un élément primitif de F4. Ses paramètres sont [q — 1,q — d,d] et c’est donc un 
code MDS. 


Preuve : à est racine (q — 1)-ième primitive de l’unité i.e. un élément primitif de F,. Le 
polynôme minimal p; (x) de @* sera x — a* donc 


g()=(x-a")(r- at). (x : a) 


engendrera C. Comme dimC = k = n — deg g = q — d, la distance minimale dist C de C 
vérifiera compte tenu de la Borne de Singleton et du Théorème précédent 


d<distC<n—-k+1=d.# 


6 Minitel 


On se réfère à l’article [1]. On rappelle qu’un octet est une succession de 8 bits, un bit 
(abréviation de ”binary digit”) désignant l’un des symboles 0 ou 1. 


6.1 Codage 


Les informations qui circulent sur les lignes téléphoniques entre deux modems sont re- 
groupées en blocs de 15 octets, et le dernier bit de chacun de ces 15 octets est un bit de 
parité (i.e. la somme des 7 bits qui le précède). A ce bloc de 15 octets on ajoute systéma- 
tiquement un octet de Contrôle de Redondance cyclique (CRC) et un octet de validation. 
De cette façon, le minitel reçoit les informations par blocs de 17 octets. 


L’octet de validation est obtenu en positionnant tous ses bits à 0. C’est 00000000 et 
il sert essentiellement à dépister rapidement les pertes d’information graves sur la ligne. 
On imagine les perturbations que peuvent occasionner les intempéries et en particulier la 
foudre tombant à proximité d’une ligne téléphonique. Dans un tel cas, il y a peu de chance 
pour que quelques uns des 8 zéros de l’octet de validation n’aient pas été remplaçés par 
des 1. Le modem du récepteur se rendra rapidement compte de l’erreur et demandera à 


l'émetteur de répéter le message. 


Intéressons-nous maintenant à l’octet CRC. Le message initial est formé d’un bloc de 
15 octets et correspond à une succession de 15 x 8 — 120 bits que nous noterons a — 
(ao, a1, .…, a119) et qui sera identifié au polynôme a (x) = ao + aix + … + ax ll. Le 
code cyclique © choisi par les ingénieurs de la Direction Générale des Télécommunications 
est de longueur n = 127 = 27 — 1 et de polynôme générateur g(x) = 7 +x° +1. On 
peut vérifier que g (x) est le polynôme minimal sur F2 d’une racine 127-ième primitive de 
l’unité, de sorte que C soit un code BCH primitif de distance construite d = 2. 

Le codage du message a se fait ainsi : 

- Multiplier a (x) par x”, 

- Ecrire la division euclidienne de x’a (x) par g (x), soit 


x'a(x) = q(x)g(x)+r(x) avec degr (x) < 7, 


- Prendre les coefficients de r (x) pour les 7 premiers octets de l’octet CRC, 
- Le 8-ième bit de l’octet CRC est un bit de parité portant sur le mot tout entier. 


Ainsi le message envoyé, que l’on notera M = (a(x){r(x)|(lu(x)), est formé de a(x) 
suivi du reste r (x) et d’un bit de parité Ç, puis suivi de l’octet de validation v (x). On 
remarquera que sa transmission revient à transmettre le mot c = q(x)g(x) du code C 
puisque 


c=q(x)g(x) = za (x) +r(x) 


est obtenu facilement à partie de M. 


Pour transmettre le message codé M, on transmet le message a (x) puis la seule difficulté 
revient à calculer rapidement le reste r (x). Cela se fait facilement à l’aide d’un circuit 
informatique appelé ” registre à décalage” et basé sur le fait que le reste r (x) de la division 
de x’a(x) par g(x) s'obtient en remplaçant systématiquement les x? intervenant dans 
le polynôme x'a(x) par des x° + 1. Plus précisemment, le circuit contient 7 cases de 
mémoires T6,.….,To Correspondant aux coefficients de r (x). Le coefficient de plus haut 
degré de x'a (x) est entré en ro, puis on décale tous les chiffres des mémoires r; vers r;11 
et l’on entre le second coefficient de x'a (x) en ro. On continue ainsi jusqu’à épuisement 
des coefficients de x’a (x), et avec la convention suivante : tout chiffre de rç ne pouvant 
pas être décalé sur la gauche sera ajouté aux chiffres des mémoires r3 et ro. On traduit par 
là que 7 = x°+1 modulo g(x). Au bout du compte, le reste r (x) est lu dans les mémoires 
r6,.…, To. La figure ci-dessous montre les décalages successifs lorsque a (x) = x? + x pour 
obtenir r (x) = x° +24 + x? + x à la dernière ligne. 


1 
LT 
1 |1 
1 |1 
1 |1 
1 |1 
1 |1 
1 1 1 
1 |1 1 |1 
1 |1 1 |1 


Ce type de codage est très rapide et s’effectue au fur et à mesure de la lecture des données 
Go, …, @126. Il se fait en temps réel. 


6.2 Décodage et correction d’une erreur 


Le message reçu est M’ = (a’ (x) |r' (x) [6’|v’ (æ)). Si l’octet de validation v’ (x) n’est pas 
nul, on demande au modem émetteur de retransmettre le message. On suppose maintenant 
que v’ (x) est nul. 

Si l’on sait que M’ ne contient pas plus d’une erreur, on est sûr de la corriger par le moyen 
ci-dessous. Dans la pratique on demandera la retransmission du message chaque fois que 
l’on a détecté une erreur multiple, en estimant que la probabilité pour qu’il y ait eu erreur 
multiple non détectée soit faible. Voici comment l’on procède : 


Si le bit de parité €’ et tous les bits de parité inclus dans la séquence a/ (x) sont justes, 
il n’y à pas eu d'erreur (avec une forte probabilité) et l’on peut considérer a/ (x) comme 
étant le message envoyé. 

Si le bit de parité C’ est faux, on cherche confirmation de l’erreur dans les bits de parités 
de a/ (x). Si un seul bit de parité de a/ (x) est faux, on estime qu’il y a eu une seule erreur 
portant sur l’octet correspondant de a’ (x), et l’on passe à sa correction (voir plus bas en 
(+)). Si tous les bits de parités de a/ (x) sont justes, on estime que l’unique erreur à eu 
lieu dans r’ (x), et l’on passe à sa correction. Par contre si plusieurs bits de parité sont 
faux, une erreur multiple est détectée et l’on demande la retransmission du message. 


Supposons ici que €’ soit faux sans qu’une erreur multiple ait été détectée, et procédons à 
la correction. L'erreur est dans (a/ (x)|r’ (x)), de sorte que (a (x){r’(x)) et (a(x)|r (x)) 
ne diffèrent que d’une coordonnée. Il existe un entier p tel que le mot de code envoyé 


c=q(x)g(x) = x'a(x)+r(x) 


diffère du mot © = x’7a/ (x) + r' (x) effectivement reçu de +?, i.e. c— € = x?. En prenant 
les classes modulo g (x), on obtient « = x? (g). Dans cette relation, on connaît « et donc 
aussi la classe de x? modulo g(x). Le lemme ci-dessous permet de retrouver x? et par 
conséquent de savoir exactement où l’erreur s’est produite. La correction d’une erreur est 
possible. 
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Lemme 1 1,x,...,x126 sont des classes distinctes de F,[x]/(g). Autrement dit, si 0 < 


p < q < 126, alors x £ x! (g). 


Preuve : Si g divise 29 — x? alors g divise °° — 1 où m = q —-p € {1,..,126}. L'un 
des zéros de g est une racine 127-ième primitive de l’unité, que nous noterons à, et l’on a 
nécessairement a” = 1, ce qui est absurde. mn 


Ce type de décodage qui s’effectue au fur et à mesure de l’arrivée des informations, est 
rapide puisque le cas le plus fréquent est celui de l’absence d’erreur. Alors Ç est juste et il 
n’y à rien à décoder, a (x) ayant déjà été lu. 


7 Compact Disc Audio : le code CIRC 


Le code CIRC (Cross Interleaved Reed-Solomon Code) est un code correcteur d’erreur de 
type BCH particulièrement adapté aux problèmes du disque compact (CD). Ces problèmes 
se résument à retrouver l'information musicale, vidéo ou autre à partir d’un CD sale, rayé 
ou présentant une petit défaut de fabrication. Les normes de Philips exigent une correction 
d’une rayure de 0,2 mm, et le code CIRC permettra de corriger des paquets d’erreurs ou 
d’effacements de 4096 bits consécutifs, ce qui correspond approximativement à une rayure 
d’un millimètre. Dans ce paragraphe, on se réfère à [7]. 


7.1 Codes raccourcis 


Soient C' un code linéaire [n, k,d] et t < k. On suppose que C possède une matrice 
génératrice G de la forme G = (A|B) où À est une matrice de taille 4 x t et de rang t, et 
l’on pose C’ = {ce C'/c =. = c«—=0} et 


e = fért, LC) € FF / (0, …, 0, Ct+1; sn) = C'} . 


Le code C”, dont les mots sont obtenus en effaçant les { premières coordonnées des mots 
de C dont les t premières coordonnées sont nulles, est appelé code raccourci de C. 


Théorème 7 C” est un code [n—t,k—t,d" > d]. 
Preuve : L'application 


D: C' _ C" 
(0, ce.) 0, CH Cn) EL (+1 .) Cn) 

est un isomorphisme d’espaces vectoriels, donc dim C” = dim C”. Notons G@ = [g1,.…., 9n]. 

Les mots du code C’ sont décrits par les produits xG quand x parcourt F,, et l’on peut 

écrire xG = ((x|g1) , …, (t|9n)) où (.|.) désigne la forme bilinéaire symétrique non dégénérée 

standard sur FŸ. Le code C” est l’image par l'application linéaire injective x — xG de 


l’orthogonal (Vect (91, …, g))- dans F. Comme g1, …, g est un système libre (en effet 
rg À =t), on déduit 


dim C’ = dim (Vect (g1, …, g))* =k—t 


et C” sera bien un code [n —t,k —t]. 
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Enfin tout mot €” = (&31,...,c) de C” provenant d’un mot € = (0,...,0,c431,.….,@) de © 
dont les { premières colonnes sont nulles, son poids sera w (c”) = w(c) > d. La distance 
minimale de C” sera > d. 


Le code raccourci d’un code de Reed-Solomon conserve la même distance minimale. En 
effet, si d désigne la distance minimale du code de Reed Solomon ©, et d” celle du code 
raccourci C”, le Théorème précédent, et la borne de Singleton permettent d’écrire 


d<d'<(n—-t)—-(k—t)+1=d. 


L'intérêt des codes raccourcis est de fournir une méthode construction de k nouveaux codes 
de longueurs plus petites à partir d’un seul code de paramètres [n, k, d] tout en conservant 
la capacité de correction du code, celle-ci étant directement liée à la distance minimale. 
C’est d’autant plus important que de nombreuses classes de codes, tels les codes BCH, ont 
des paramètres très spéciaux qu'il s’agit d’adapter aux diverses contraintes techniques, et 
que les 3 paramètres n, k, d d’un code ne sont pas indépendants entre eux mais liés par 
de nombreuses relations (telles les bornes de Hamming ou celle de Singleton). En règle 
générale, fixer 2 de ces paramètres revient à déterminer le troisième. 


7.2 Codes démultipliés 


Dans la grande majorité des cas, des problèmes de lecture d’un disque compact survi- 
ennent lorsque le disque est sale, lorsque sa surface est rayée ou présente un défaut de 
fabrication. La perte d’information a lieu sur un nombre ”’important” de bits contigus, 
donnant naissance à ce que l’on appelle des ” paquets d’erreurs”. La correction de paquets 
d'erreurs est donc tout à fait typique des codes correcteurs présents sur un lecteur de CD, 
et fait en particulier appel aux codes démultipliés. 


Soit C un code [n,k] sur F,. Notons q = p”' où p est premier, et appelons a un élé- 
ment primitif de F, (i.e. une racine primitive (q — 1)-ième de l’unité dans F,). On sait 
que (1,a,..., al) est une base du F,-espace vectoriel F4. Si (1, .…., Tim) désignent les 
coordonnées de x; € F, dans cette base, on peut définr l’application : 


Ÿ : Fe _ F7 


PR En AR ne ne D a 
Ÿ est un isomorphisme de F,-espaces vectoriels appelé démultiplication, et la bijection 
réciproque Ÿ-! est appelée contraction. Le code C’ démultiplié de C' n’est autre que 
l’image Y (C) de C par Y. C’est un code de paramètres [nm,nk] sur F,. Si d désigne 
la distance minimale de C', rappelons que © corrige e — [51] erreurs. Un mot x — 
(x1,.….,2») de longueur n de C sera démultiplié en un mot x de longueur nm de C” 
suivant le schéma 


TL : T1 T2 er Ti ae Tn 
le 
TX 2 L11,..., Lim 21,5... Tom + Lil... Lim + nl... Lnm 


S'il y a moins de m(e — 1) + 1 erreurs consécutives dans le mot +’, il y aura moins de e 
coordonnées erronées dans x, et la correction de x est possible. Autrement dit : 


Théorème 8 Si un code sur F,m corrige e erreurs, son démultiplié sur F, corrigera 
jusqu'à m(e — 1) + 1 erreurs consécutives. 
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7.3 Effacements 


Il arrive souvent que le lecteur ne puisse déterminer la valeur du bit qu’il est en train de lire. 
On dit que l’on a affaire à un effacement. Le problème des effacements est un peu différent 
de celui de l’erreur dans le sens où le décodeur sait qu’il y a eu disparition d’information 
à l’endroit occupé par le symbole effacé. Dans le cas d’une erreur, le décodeur est à priori 
incapable de dire si le symbole proposé est vrai ou faux. Cette différence est mise en valeur 
dans les deux résultats suivants : 


Théorème 9 Un code (éventuellement non linéaire) de distance minimale d peut corriger 
f =d-—1 effacements. 


Preuve : Si cet « sont deux mots de code qui possèdent n — (d — 1) coordonnées iden- 
tiques, alors c et € diffèrent sur au plus d— 1 coordonnées et d(c, ) < d—1. Cela entraine 
C=C.u 


Théorème 10 Un code (éventuellement non linéaire) de longueur n et de distance mini- 
mum d > 2e + f +1 corrige e erreurs et f effacements. 


Preuve : Soit x = (x1,..,2n) € C et x’ le mot entaché de p < e erreurs et q < f 
effacements. Soit H l’ensemble des mots de C identiques à x sur les n — q coordonnées 
non effacées. Il faut montrer l’existence d’un seul mot du code C’ situé à une distance < e 
de H. Raiïisonnons par l’absurde : si y et z sont deux mots de C et si h,k € H vérifient 
d(y,h) <eet d(z,k) <e. Alors 


d < d(y,z) < d(y,h)+d(h,k) +d(k,z) <2e+q<2e+f 
ce qui est contraire à l’hypothèse. = 


7.A Entrelacements 


L'objectif est encore ici de corriger de gros paquets d’erreurs. Considérons t mots 71,2%, ..., #4 
d’un code C et écrivons ces mots sur t lignes. On obtient le tableau 


Mot EU À ll CS 2% Tr 
Mot LD À Loi -L99 4e  L9r 
Mot Lt : Lt Lt . Lin 


Au lieu d'envoyer ce tableau ligne après ligne, on décide de l’envoyer colonne après colonne. 
On considère par conséquent le mot 


T11221...4111120 22... 042... Tin 


obtenu par l’entrelacement de { mots de C. L'ensemble des ces mots forme un code C” 
de longueur nt et de dimension kt, appelé code entrelacé de profondeur t du code 
C. Si C corrige L erreurs consécutives, l’examen du tableau ci-dessus permet de voir 
que C” corrigera des paquets d’erreurs de longueur [t, ce qui constitue une amélioration 
substancielle. 
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Présentons maintenant une autre technique d’entrelacement très efficace. Considérons 
toujours les mêmes mots 21,...,2 de C. La technique d’entrelacement avec un retard r 
consiste dans un premier temps à construire le tableau suivant dans lequel la première 
ligne est formée des premières coordonnées des mots x1,...,æ1, la seconde ligne est formée 
des secondes coordonnées de ces mots mais décalés sur la droite de r symboles 0, et ainsi 
de suite sans oublier de décaler de r symboles vers la droite à chaque passage à la ligne. 


T11 MAT 2e ess … … +] 0 0 … 0 
0 0 ue 0 T12 T22 ses …. +2 0 

0 

0 OT sé ce a 00 6. 6% Le 466 


On transmet ensuite les colonnes de ce tableau pour obtenir un nouveau mot qui appartient 
à un code C”’. C”' est le code entrelacé de profondeur t avec un retard r du code C. 


Les symboles du premier mot æ1 ont été soulignés dans le tableau. r colonnes successives 
du tableau ne contiennent qu’un symbole figurant dans x1. Par suite, si l’on perturbe les 
symboles de {r colonnes de ce tableau auxquels on peut rajouter !{ symboles ” limitrophes”, 
on touche à moins de ! symboles consécutifs de chacun des mots æ1,...,x4 de C. Cela signifie 
que si C corrige l erreurs consécutives, alors C” corrigera { (rn + 1) erreurs consécutives. 


Exemple : Pour écrire l’entrelacement des trois mots 


Mot a : a1 a2 a3 aa 
Mot b : bi bo b3 b4 
Mot © : C1 C2 C3 Ca 


avec un retard r = 2, on construit le tableau 


ai b1 € O0 0 0 0 0 0 
0 0 a2 bo C2 0 0 0 0 
0 0 0 O0 a3 b3 c3 0 0 
0 0 0 0 0 O0 a ba ca 


et le mot entrelacé avec retard sera 


a 0008: 000c: a2000b; 000c2a3000b3000c3a4000b4000c4 à 
es, es” 


18 symboles 


Ici (n,t,r) = (4,3,2) et si C corrige des paquets de { = 2 erreurs, alors C” corrigera bien 
des paquets de 18 erreurs. 


7.5 Code CIRC 


Soit C le code de Reed-Solomon de polynôme générateur 
g(x) =(x- a) (x — &) (x — a) (x — a) 


où à est un élément primitif de F256. C est un code [255,251,5] sur F256 qui permet de 
construire deux codes raccourcis de distance minimale encore égale à 5 (cf 87.1) : 
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-Un code Cï de paramètres [28, 24,5], 
-Un code C2 de paramètres [32, 28, 5]. 


Après échantillonage et quantification, le signal sonore se présente en trames de 24 octets. 
Ces 24 octets servent de symboles d’information du code C; et donnent naissance à des 
mots de 28 octets. Ces mots sont ensuite entrelacés avec une profondeur de 28 et un retard 
de 4 pour servir de symboles d’information du code C2. Voyons maintenant comment 
s'opère le décodage des trames de longueur 32 lues par l’appareil.….. 


e Action de C2 : Le code C2 est capable de corriger 2 erreurs, mais on l’utilise pour n’en 
corriger qu’une. Il peut détecter 3 erreurs. Si l’on note x le mot de FÆ, lu par l’appareil, 
trois cas sont possibles : 


al) Si x € C2, on estime que x représente le mot correct et qu’il n’y à pas eu d’erreur, 
a2) Si x est à une distance de C2 égale à 1, on estime qu’il y a eu une seule erreur, et le 
code C2 la corrige, 

a3) Dans tous les autres cas, on remplace x par 28 effacements qui seront désentrelacés 
puis envoyés sur le décodeur de C1. 


Les cas al et a2 peuvent donner lieu à une erreur de décodage, mais la probabilité d’erreur 
est infime. Pour le voir, supposons que tous les mots de F#, soient équiprobables, ce qui 
constitue une hypothèse pénalisante. Le mot x sera mal décodé par le processus al ou a2 
dès que x appartient à l’une des boules fermées de rayon 1 centrée sur un mot du code C2 
sans être le centre de cette boule. Une boule fermée de rayon 1 de F8, contient 1+255.Ck 
mots. C2 contient 256% mots et F3, en contient 256%. La probabilité d’une erreur au 
décodage sera donc majorée par : 


25678 (1 + 255.Ch) 


DEnse 1,910 


ce qui est négligeable. Le même raisonnement pratiqué dans le cas où l’on utiliserait la 
double capacité de correction d’erreurs de C2 fournirait le majorant suivant bien trop 
grand pour être retenu : 


25628 (1 + 255.C4, + 2552.02) 


3 
es SbA0S 


e Action de C3 : Dans les cas al et a2, le mot, éventuellement corrigé par C2, est désen- 
trelaçé puis décodé par C1 pour fournir l’information originelle. Plaçons-nous maintenant 
dans le cas a3. Les 28 symboles du mot ont été effacés et constituent une colonne de la 
matrice d’entrelacement. Pour le voir, il faut se référer au 87.4 et bien comprendre qu'ici, 
nous avons entrelaçé 28 mots de F#, donnés en lignes dans le tableau 


Mot T1 : T1,1 T1,2 21,28 
Mot Ty à T2,1 T2,2 12,28 
Mot Z28 : 281 T282 .… 128,98 
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et que la matrice d’entrelacements est 


T1,1 221 23,1 4,1 ds de T28,1 
0 0 0 0 71,2 22 13,2 T42 Etre T28,2 
0 0 0 0 0 . . 0 11,28 12,28 +. 128,28 


CA corrige 4 effacements donc sera capable de corriger 4 x 4 = 16 colonnes entières de cette 
matrice d’entrelacements. Chacune de ces 16 colonnes de 28 symboles provient d’un mot 
de 32 symboles (soit 32 x 8 bits 0 ou 1) avant traitement par le code C2. Par suite, le code 
CIRC sera capable de corriger des effacements contigüs de longueur 16 x 32 x 8 — 4096 
bits sur la surface du disque compact, ce qui correspond à des rayures d'environ 1,23 mm 
sur le disque et se trouve bien au dessus des normes de Philips (0,2 mm). 
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